INFORMATIQUE ET SCIENCES HUMAINES - Histoire et informatique


INFORMATIQUE ET SCIENCES HUMAINES - Histoire et informatique
INFORMATIQUE ET SCIENCES HUMAINES - Histoire et informatique

Les historiens utilisent l’informatique depuis quelques dizaines d’années. À partir des années 1970, après la parution de quelques livres pionniers (M. Couturier, T. K. Rabb), l’emploi de l’ordinateur pour le traitement de données historiques connut un rapide essor. Ainsi, chaque année, plusieurs milliers de travaux conjuguant la recherche historique et l’usage d’un langage informatique sont répertoriés par la revue Computer and the Humanities . De même, les actes de récents colloques ou congrès réunissant des historiens spécialistes des analyses automatiques de textes, de la création et de la gestion de banques de données ou d’histoire quantitative témoignent en ces domaines d’une incontestable efflorescence intellectuelle. Enfin, la parution de revues ou de bulletins d’informations, tels que Computer and the Humanities (déjà citée), Programmation et sciences de l’homme , Mathématiques et sciences humaines , Informatique et études médiévales (au Québec, depuis 1971), ou Le Médiéviste et l’ordinateur (depuis 1979), assure l’indispensable liaison entre tous les chercheurs en sciences humaines (dont les historiens) qui ont recours à l’informatique.

La machine et le problème de l’historien

La multiplication des références bibliographiques, la tenue de réunions universitaires et la mise en chantier d’enquêtes de plus en plus ambitieuses ne doivent pas, malgré tout, faire illusion. D’une part, le nombre de recherches de grande envergure employant l’ordinateur pour la collecte, l’édition ou l’exploitation d’archives demeure assez limité, parce que l’informatique nécessite toujours la mobilisation d’importantes et coûteuses ressources matérielles et intellectuelles; d’autre part, la grande majorité des historiens, quels que soient les «écoles» ou les courants de pensée auxquels ils appartiennent, ne sont guère convaincus de la nécessité de recourir à l’informatique afin d’étudier les institutions et les sociétés du passé. Il est vrai que l’application de moyens informatiques au traitement de sources historiques a parfois donné des résultats très décevants: au terme d’un long et fastidieux processus de codage et de collecte des données, des recherches historiques ont abouti à des évidences ou à des truismes, sans offrir des perspectives très neuves par rapport à des travaux antérieurs qui avaient été conduits avec des moyens plus artisanaux. Ces échecs sont d’autant plus cuisants qu’ils impliquent presque toujours un indéniable gaspillage de travail et d’argent; mais ils tiennent souvent moins à l’emploi intempestif de telle ou telle nouvelle méthode d’investigation des données qu’à une insuffisante évaluation des concepts et des buts de recherche. «En histoire comme ailleurs, souligne Emmanuel Le Roy Ladurie, ce qui compte ce n’est pas la machine mais le problème. La machine n’a d’intérêt que dans la mesure où elle permet d’aborder des questions neuves, originales par les méthodes, les contenus et surtout l’ampleur!»

À l’évidence, la politique de l’informatisation à tout prix de la recherche historique a eu des effets globalement négatifs, aux États-Unis d’abord, en Europe ensuite; d’où l’expression d’un certain désenchantement après le bel engouement des années 1970... Toutefois, l’usage mesuré et maîtrisé de l’informatique en histoire a déjà incontestablement produit des résultats prometteurs dans beaucoup de domaines, tels que l’archéologie, le traitement de sources en full-text , ou le dépouillement des corpus statistiques du XIXe siècle. L’informatique devient ainsi insensiblement une science auxiliaire de l’histoire, un outil dont l’emploi se banalise peu à peu et qui perd heureusement son côté spectaculaire ou parfois mystificateur: c’est souvent au détour d’une note en bas de page, remarque malicieusement Philippe Genêt, que l’on apprend que tel chapitre d’une thèse on ne peut plus traditionnelle a été écrit grâce à l’exploitation discrète d’un fichier informatique. Le développement de la mini-informatique (dû à la conception des microprocesseurs) puis celui de la micro-informatique, l’implantation croissante des systèmes conversationnels et l’évolution des logociels (les langages informatiques, ou langages évolués, se rapprochent de plus en plus des langues naturelles) ont transformé la conception même des tâches informatiques. L’optimisme béat devant les progrès de la technologie n’est certes plus de mise. Signalons seulement ceci: tout historien (ou chercheur en sciences sociales) bénéficiant d’une assistance technique (celle qu’offrent généralement tous les centres de calcul) et d’une formation de base dans un langage informatique (qui n’exige, faut-il le souligner, aucun bagage mathématique de haut niveau, et demande seulement de la rigueur et du bon sens) peut travailler lui-même, sans intermédiaire, avec un ordinateur; à condition bien sûr (et c’est l’essentiel), de savoir interroger les données qu’il a engrangées. Cette utilisation directe de l’ordinateur semble encore illusoire ou utopique à beaucoup d’universitaires, qui emploient pourtant l’informatique, mais laissent à l’informaticien le soin de nourrir et servir la machine, se réservant des tâches plus «nobles», telles que la mise au point d’une problématique et l’analyse des résultats... Cette division du travail rend souvent le chercheur très dépendant de l’homme de métier; elle exige en tout cas du promoteur d’une enquête un contrôle étroit des différentes étapes du traitement informatique: elle suppose donc aussi une connaissance point trop superficielle des possibilités et des limites d’un ordinateur.

Quelles sources?

Pour l’historien, le recours à l’informatique pose des problèmes méthodologiques qui tiennent d’abord à la nature des sources qu’il exploite. Ces problèmes de méthode ne se réduisent pas seulement à des questions techniques, qui seraient exclusivement du ressort des spécialistes, et n’auraient pas à être évoquées dans un article de vulgarisation scientifique. Bien au contraire, la préparation des données, afin de confectionner ce que les Anglo-Saxons appellent le machine-readable-record , impose des choix essentiels et irréversibles qui mettent en jeu la conception même d’une recherche.

L’historien travaille sur toutes les traces matérielles (documents écrits, objets, paysages...) laissées par les sociétés. Il a donc affaire à des sources d’origines très variées, souvent incomplètes ou lacunaires, aux formes multiples, dont l’état de conservation est parfois très médiocre. Certaines sources possèdent une structure formelle assez proche de celle des documents administratifs et commerciaux contemporains, qui sont désormais exploités de plus en plus fréquemment par l’informatique de gestion. En effet, très tôt, les États et les économies d’autrefois ont sécrété des archives de comptabilité et de surveillance, telles que les rôles fiscaux, les cadastres, les cartulaires, les recensements, les registres d’état civil, les mercuriales et bien d’autres encore; plus près de nous, à partir du début du XIXe siècle, ont été créés des annuaires statistiques nationaux... Bref, autant de documents qui peuvent se ramener à peu près à ce modèle: description d’une unité statistique (un individu, un «feu», un ménage, une exploitation agricole, une circonscription administrative) au moyen de variables quantitatives ou qualitatives. Certes, les historiens n’ont pas attendu la «révolution informatique» pour exploiter ce type de documents dans de grandes monographies d’histoire économique ou sociale; mais le traitement informatique, comme le remarque David Herlihy, a incontestablement permis de mieux dominer ces sources «sérielles», d’en déceler et d’en corriger systématiquement les erreurs et les ambiguïtés, et aussi d’analyser celles-ci d’une façon plus fine et plus exhaustive. La création de fichiers informatiques, à partir de tels documents, semble une opération assez simple; celle-ci devient malgré tout délicate si la source montre une structure complexe combinée avec une grande richesse de vocabulaire et si l’unité statistique est de longueur variable. Que dire alors à propos d’autres documents, tels que les chartes médiévales, les actes notariés ou les causes judiciaires, ces magnifiques sources sérielles, souvent à peine égratignées par l’érudition traditionnelle, qui nécessitent une étude sémantique approfondie, et pas seulement des comptages.

Tous ces documents recèlent une information foisonnante qui (sauf exception) est rebelle a priori à tout traitement informatique, alors que ce mode d’exploitation est susceptible d’apporter une riche moisson de résultats dans les divers «territoires» de l’historien. En effet, le traitement informatique des sources historiques impose d’abord des choix (faut-il prendre en compte toutes les données contenues dans le document? sous quelle forme et avec quelle syntaxe?) et des simplifications, voire des «mutilations» (le codage des données non numériques). Choix et simplifications sont apparemment indispensables à la création d’un fichier collecté sur un support quelconque (carte perforée, ruban perforé ou bande magnétique), qui pourra être «lu» par l’unité périphérique d’un ordinateur, corrigé et exploité à l’aide de programmes écrits en langages évolués ou en assembleur. La création de tels fichiers semble d’abord dépendre de facteurs matériels et humains, qui tiennent à la qualité de l’environnement informatique: les capacités de l’ordinateur, l’habileté du ou des programmeurs, et les crédits dont on dispose pour la collecte et le traitement de ses données... En fait, c’est l’historien (et lui seul) qui est responsable de la mise en œuvre des documents; et c’est lui-même qui doit choisir, en fonction de ses hypothèses de travail, les modalités techniques de cette mise en œuvre.

Quels traitements?

Deux démarches, deux «stratégies» (pour reprendre l’expression de David Herlihy) sont possibles. La première s’inspire des logiciels de dépouillement d’enquête, qui furent mis au point aux États-Unis par des instituts de sondage d’opinion ou par des sociétés de marketing, puis largement utilisés et développés par les sociologues; elle consiste à établir un questionnaire, une sorte de grille où sont codées et formalisées les données recueillies sur une série d’événements (par exemple, les révoltes et les troubles sociaux en France de 1830 à 1930 étudiés par C., L. et R. Tilly) ou sur un ensemble d’individus. Il ne s’agit pas, pour l’historien, d’emprunter quelque fabuleuse «machine à explorer le temps» et d’aller demander au paysan du siècle de Louis XIV ou au boutiquier parisien du règne de Louis-Philippe ce qu’ils pensent de leurs conditions d’existence et quelles sont leurs opinions sur tel ou tel sujet! En fait, ce sont les historiens qui, à l’aide d’archives et de documents souvent très variés, recherchent les réponses aux questions qu’ils ont posées. Ce type d’enquête, surtout familier à l’historiographie américaine, est très critiqué, parce qu’il implique une manipulation et une juxtaposition d’informations très hétérogènes, afin de vérifier des hypothèses, voire d’expérimenter des modèles. À l’évidence, ceux que l’on appelle un peu vainement les cliométriciens ont beaucoup «sollicité» les sources pour obtenir des résultats assez surprenants. En tout cas, cette méthode est désastreuse quand le questionnaire ne comprend pas telle ou telle variable pourtant indispensable à l’analyse d’une question d’histoire; imaginons, par exemple, que les auteurs d’une recherche sur les révoltes paysannes en France pendant la période du XVe au XVIIIe siècle n’aient pas pris en compte une ou plusieurs questions sur la fiscalité...

L’autre démarche, plus prosaïque et moins suggestive, est aussi plus proche des tâches traditionnelles de l’historien: la collecte, la critique, l’édition et l’analyse des sources. On part ici d’un document à l’état brut ou d’une série homogène de documents qu’il faut coder et formaliser afin de concevoir un fichier informatique qui soit à la fois fidèle à la source et exploitable avec l’ordinateur. Ces deux exigences sont parfois difficilement compatibles, sinon contradictoires. Cependant, si toute création d’un fichier informatique nécessite toujours une formalisation rigoureuse des données, des recherches récentes montrent qu’on peut collecter exhaustivement des types de données historiques très complexes, en employant une syntaxe informatique très souple, proche de la langue naturelle, et surtout sans opérer de codage préalable des informations non numériques. Dans une étape ultérieure, c’est un jeu de programmes qui «liste» et trie tout le vocabulaire du fichier de données brutes; puis code automatiquement ce vocabulaire à l’aide de dictionnaires (la confection des codes du ou des dictionnaires est tout de même à la charge de l’utilisateur, mais une fois constitués, les dictionnaires peuvent être réutilisés pour le codage d’autres fichiers). Cette méthode est sans doute plus coûteuse et plus complexe; mais elle présente un avantage inestimable sur les techniques traditionnelles de saisie de données, parce qu’elle autorise le repentir, voire l’erreur: on peut ainsi recommencer partiellement ou totalement le codage d’un fichier source. (Des historiens ont conçu des systèmes informatiques mieux adaptés au traitement de sources historiques; signalons le langage Forcod mis au point par M. Couturier à l’École des hautes études en sciences sociales.)

Enfin, avec les programmes de traitement de texte, l’historien (à l’instar du linguiste) ne travaille même plus sur un fichier de données codées, mais sur la source elle-même, avec son orthographe et sa ponctuation originales; à la limite, l’ordinateur sert uniquement d’éditeur de texte; cette dernière option, un peu frustrante, a été surtout employée par les historiens médiévistes (L. Fossier et al.).

Nous ne croyons pas, pour conclure, que la «révolution informatique» ait encore bouleversé la recherche historique. Les changements essentiels, dans tous les domaines de l’historiographie, sont apparus lorsque s’est amorcée l’évolution qui a conduit les historiens à s’intéresser de plus en plus à l’analyse de la vie matérielle, sociale et culturelle des mondes d’autrefois. Le recours à l’informatique, avec la création de multiples fichiers de données historiques, a accentué cette orientation. Toutefois, l’ordinateur ne sert pas seulement de «bête de somme»; l’utilisation judicieuse de programmes d’analyse de données a permis et permettra de plus en plus une exploration très fine et approfondie du passé. Il n’existe pas, au fond, une informatique spécifique à la science historique; mais en faisant le bilan des expériences effectuées, remarquons que l’intelligence artificielle et l’intelligence humaine peuvent s’accorder quelquefois pour écrire de passionnants chapitres de l’histoire des gens.

Encyclopédie Universelle. 2012.

Regardez d'autres dictionnaires:

  • INFORMATIQUE ET SCIENCES HUMAINES - Le droit de l’informatique — Nombreuses sont aujourd’hui les interactions du droit et de l’informatique. Si l’informatique juridique documentaire devient indispensable au juriste qui doit apprendre à interroger les grandes banques de données, d’un autre côté, comme tout… …   Encyclopédie Universelle

  • INFORMATIQUE — LE MOT «informatique» a été proposé en 1962 par Philippe Dreyfus pour caractériser le traitement automatique de l’information. Ce terme a été accepté par l’Académie française en avril 1966, avec la définition suivante: «Science du traitement… …   Encyclopédie Universelle

  • Sciences Informatiques — Informatique théorique L informatique théorique est l étude des fondements logiques et mathématiques de l informatique. Plus généralement, le terme est utilisé pour désigner des domaines ou sous domaines de recherche centrés sur des vérités… …   Wikipédia en Français

  • Informatique Théorique — L informatique théorique est l étude des fondements logiques et mathématiques de l informatique. Plus généralement, le terme est utilisé pour désigner des domaines ou sous domaines de recherche centrés sur des vérités universelles (axiomes) en… …   Wikipédia en Français

  • Informatique theorique — Informatique théorique L informatique théorique est l étude des fondements logiques et mathématiques de l informatique. Plus généralement, le terme est utilisé pour désigner des domaines ou sous domaines de recherche centrés sur des vérités… …   Wikipédia en Français

  • Informatique théorique — L informatique théorique est l étude des fondements logiques et mathématiques de l informatique. Plus généralement, le terme est utilisé pour désigner des domaines ou sous domaines de recherche centrés sur des vérités universelles (axiomes) en… …   Wikipédia en Français

  • Informatique affective — L’ informatique affective (en anglais : Affective computing) est l étude et le développement de systèmes et d appareils ayant les capacités de reconnaître, d’exprimer, de synthétiser et modéliser les émotions humaines. C est un domaine de… …   Wikipédia en Français

  • Sciences et techniques en 1960 — 1960 en science Années : 1957 1958 1959  1960  1961 1962 1963 Décennies : 1930 1940 1950  1960  1970 1980 1990 Siècles : XIXe siècle  …   Wikipédia en Français

  • École nationale des sciences appliquées de Tanger — (ENSAT) Informations Fondation 1998 Type Formation d ingénieur au Maroc Grande École d Ingénieurs Publique Localisation …   Wikipédia en Français

  • Ecole pour l'informatique et les techniques avancees — École pour l informatique et les techniques avancées EPITA Localisation Localisation Le Kremlin Bicêtre (et Villejuif), France Informations Fondation 1984 Directeur Joël Courtois Type …   Wikipédia en Français

  • École privée des sciences informatiques — Informations Fondation 1961 Fondateur Groupement Professionnel National de l Informatique[1] …   Wikipédia en Français


Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.